AI 圖像生成技術演進 (1)
今天,我們先來回顧 AI 圖像生成技術的演進,了解這些模型的核心概念與特性,為後續實作打下基礎。
一、AI 圖像生成的起點:生成對抗網絡(GAN)與變分自編碼器(VAE)
可追溯到早期的生成式模型,其中最具代表性的是
GAN 的核心理念是由一個 生成器 嘗試創建圖片,而另一個 判別器 判斷真假。透過不斷對抗學習,生成器能產生越來越逼真的圖像。VAE 則透過潛在空間(latent space)進行圖像編碼與重建,適合用於控制生成特徵或風格。
雖然這些模型奠定了生成式 AI 的基礎,但訓練不穩定、生成速度慢、對硬體需求高,使即時前端應用存在挑戰。
二、Diffusion 模型:生成更真實的圖像
隨著技術進步,擴散模型(Diffusion Models) 近年快速崛起,成為當前主流的圖像生成技術。Diffusion 模型的運作方式是:先逐步向圖像加入雜訊,再逐步去噪重建原始影像。
其特點包括: